МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ «ЛЬВІВСЬКА ПОЛІТЕХНІКА»
кафедра Захисту інформації
ЗВІТ
про виконання лабораторної роботи №3
з курсу “Робота в Інтернеті”
Вивчення пошукових систем і програм для знаходження інформації в інтернеті
Варіант №4
Виконав:
студент групи ІБ - 44
Прийняв:
Ракобовчук Л.М.
Львів 2009
Мета: ознайомлення з пошуковими системами і програмами для пошуку інформації в Інтернеті, вивчення проблем пошуку та здійснення пошуку по ключовим словам й каталогам, пошук у зонах і елементах web-сторінки.
Короткі теоретичні відомості
У мережі Internet знаходяться мільярди Web-сторінок, терабайти інформації в різних файлах, але вся проблема в тому, що для одержання потрібної інформації необхідно вказати її точну адресу – URL. Саме цю адресу нам і потрібно знайти в першу чергу. Якщо ми знайдемо такий URL, то без проблем введемо його в адресний рядок програми Internet Explorer і побачимо потрібну Web-сторінку, або скачаємо файл.
Найпростіший спосіб знпходження адреси (URL)– побачити доменні імена в різних рекламних матеріалах. Як правило, вказується коротка адреса, що складається лише з доменного імені www.ukr.net.
Якщо адреса зовсім невідома, то для цього потрібно звернутися до спеціальних пошукових систем. Пошукові системи (пошукові каталоги, пошукові сервери) виконані у виді Web-сторінок, але на цих сторінках розташовується не інформація як така, а анотовані посилання на інші ресурси (сторінки, сайти).
Для виклику пошукової системи необхідно в адресному рядку програми Internet Explorer вказати її адресу.
Перший етап роботи пошукової системи – це індексування інформації, що знаходиться в Internet. Мережевний робот пошукової системи переглядає величезну кількість сторінок і заносить адреси і короткий зміст цих сторінок до себе в базу даних, точніше в пошуковий індекс. Власники сайтів будуть дуже раді, якщо їх сайт перегляне мережевий робот. Для того, щоб робот обов'язково переглянув сайт і вніс його в пошуковий індекс, власники самі реєструють свої сайти в пошуковій системі (як правило, у декількох пошукових системах). Процес занесення адреси й описи сторінки в пошукову систему називається індексація.
Пошук по ключових словах
Яндекс – це досить велика і популярна пошукова система. Щоденна аудиторія Яндекса складає більш 1 мільйона чоловік, а щомісячна – близько 8 мільйонів. Обсяг проіндексованої інформації, включеної в пошуковий індекс складає 5610 Гб – це 180 мільйонів унікальних документів, розташованих більш ніж на мільйоні серверів, і, звичайно, ці цифри постійно ростуть.
Основний алгоритм пошуку наступний:
введення ключових слів в поле запиту;
натиснення кнопки Знайти.
Після натискання кнопки Знайти, Яндекс виведе список посилань на документи, що найбільше точно відповідають запитові.
На сторінці Яндекс є деякі спеціальні позначення і посилання, призначені для полегшення перегляду і сортування знайдених сторінок.
Пошукова форма. Головний її елемент – поле запиту.
Статистика пошуку: кількість знайдених документів.
Сортування по спаданні дат чи по ревалентності. Спочатку список сортується по ревалентності, тобто по ступені відповідності результату запитові.
Результати пошуку – список знайдених посилань. Для кожного документа видається наступна інформація: заголовок – посилання на ресурс, коротка анотації ресурсу (сторінки), знайдені слова, схожі документи, і, якщо знайдений сайт описаний у каталозі, перехід у відповідну рубрику каталогу. Крім цього, інформація про розмір, дату документа, URL документа.
Перехід на наступні сторінки...